Chapter 16. 시각-언어 모델과 개방형 어휘 인식 (VLMs & Open-Vocabulary Perception) Chapter 16. 시각-언어 모델과 개방형 어휘 인식 (VLMs & Open-Vocabulary Perception) 16.1 패러다임의 확장: 폐쇄형(Closed-set)에서 개방형(Open-set) 인식으로 16.2 시각-언어 정렬(Vision-Language Alignment)의 핵심 원리 16.3 텍스트 프롬프트 기반 객체 탐지 (Open-Vocabulary Object Detection) 16.4 픽셀 수준의 이해: 세그멘테이션과 어포던스 16.5 3D 공간과 의미론적 지도 작성 (Semantic Mapping in 3D) 16.6 로봇 지각을 위한 최신 VLM 아키텍처 및 튜닝 16.7 한계와 도전 과제: 환각과 실시간성